Integración de fuentes heterogéneas de datos textuales

نویسندگان

  • Benina Velázquez Ordoñez
  • Jesús-Manuel Olivares-Ceja
  • Miguel Patiño Ortiz
  • Julián Patiño Ortiz
  • Adolfo Guzmán-Arenas
چکیده

This paper proposes an alternative to data integration from heterogeneous sources or databases. In some cases, inconsistencies may occur, and in others, the schema lacks of any attribute or entity to store the data. Some inconsistencies are consequence of using a language different with the one employed in the schema definition; others are due to the use of distinct units of measure. The object-oriented model provides characteristics that facilitate the class reuse and extension. The samples are obtained from heterogeneous Web sources belonging to the domain of computer equipment. Integration involves entities, attributes, values, and units of measurement. Manuscrito recibido el 19 de junio de 2014, aceptado para su publicación el 10 de julio de 2014, publicado el 15 de junio 2015. Benina Velázquez Ordoñez (autor correspondiente) estudia en el Instituto Politécnico Nacional (IPN), en la Escuela Superior de Ingeniería Mecánica y Eléctrica (ESIME), DF, México (correo: [email protected]). Jesús Manuel Olivares Ceja y Adolfo Guzmán Arenas trabajan en el IPN, en el Centro de Investigación en Computación (CIC), México, DF (correo: [email protected], [email protected]) Miguel Patiño Ortíz y Julián Patiño Ortíz trabajan en el IPN– ESIME, DF, México (correo: {mpatino2002, jpatinoo}@ipn.mx).

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ELAN: Una Red Distribuida y Políglota de Recursos Lingüísticos Textuales

Resumen. En este artículo presentamos el proyecto MLIS-ELAN cuyo objetivo principal es la creación de una red distribuida y políglota de bases de datos de recursos lingüísticos textuales. Primero, definimos el término de “recurso lingüístico textual” y mostramos la importancia de la normalización en el marco de la representación y de la utilización de este tipo de recursos. Después, presentamos...

متن کامل

Integración de Colecciones Heterogéneas en Bibliotecas Digitales

Resumen. La heterogeneidad en las bibliotecas digitales dificulta la integración de colecciones documentales destinadas a constituir una nueva biblioteca digital. Dicha heterogeneidad puede deberse, entre otras, a las siguientes causas: distintos modelos de documentos, formatos diferentes, distintos modelos en los atributos, y distintas sintaxis en los lenguajes de consulta y en los datos que c...

متن کامل

Metodología para el Análisis Visual de la Evolución de Conceptos en Bases de Datos Textuales

El análisis de los datos almacenados en las bases de datos textuales se hace cada vez más complejo debido al aumento del volumen y la entropía. Estos problemas obligan a buscar nuevos métodos para analizar el contenido de las bases de datos textuales. En este artículo presentamos una metodología que permite el seguimiento de núcleos de información, representados en forma de conceptos. Estos con...

متن کامل

MDBE: Una Herramienta Automática para el Modelado Multidimensional

Los sistemas Data Warehousing tienen como objetivo ayudar en la toma de decisiones de las organizaciones. Para ello, estos sistemas integran y homogenizan los datos de la organización en un Data Warehouse (DW), con el objetivo de obtener una representación única y detallada de nuestro negocio. Por definición, un DW es una gran base de datos que, por sí misma, es incapaz de aportarnos informació...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Polibits

دوره 51  شماره 

صفحات  -

تاریخ انتشار 2015